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摘 要 : [目的 /意义 ] 对 十 籍 数字 化 研究 历程 和 现状 进行 梳理 , 以 探寻 古籍 数字 化 研究 的 发 展 趋势 。[ 方法 “过程 ] 运 用 
CiteSpace 软件 对 近 10 年 来 古籍 数字 化 研究 的 作者 、 关 键 词 进行 共 现 图 谱 分 析 , 分 析 期 刊 论文 研究 及 国家 社 科 基 
金 项 目的 主要 研究 领域 和 主题 分 布 ,对 现 有 古籍 数字 化 产品 的 主要 功能 进行 考察 和 体验 。[ 结果 /结论 ] 总结 出 我 
国 近 10 年 来 古籍 数字 化 研究 的 3 大 总 体 特征 和 5 个 主要 问题 ,指出 在 学 术 传 承 、 用 户 需 求 、 信 息 技 术 发 展 的 驱动 


下 ,面向 知识 服务 是 未 来 古籍 数字 化 研究 的 必然 趋势 。 
用 户 需求 “技术 发 展 
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学 术 传 承 


出 ,到 大 规模 建设 各 种 类 型 的 古籍 数据 库 ( 如 书 
[加 全文 型 和 影像 型 数据 库 等 ) ,发 展 到 今天 利用 计 
机 信息 处 理 技术 对 古籍 数字 文本 进行 各 种 深加工 


1 识 挖 气 等 ,人 们 对 古籍 数字 化 的 认识 也 在 不 断 发 
展 它 最 初 人 们 对 古籍 数字 化 的 理解 只 是 将 纸 质 古 籍 的 
本 信息 转换 成 数字 形式 ,以 便 长 久保 存 和 利用 ,进而 
利 旭 计算 机 处 理 信息 的 技术 优势 ,开发 出 便捷 高 效 的 
全 文 检索 功能 。 随 着 数字 信息 技术 的 发 展 , 特 别 是 本 
世纪 初 “ 数 字 人 文理 念 的 兴起 ,人 们 发 现 还 可 以 将 转 
换 后 的 古籍 数字 文本 当 作 进 一 步 加 工整 理 的 数据 , 通 
过 一 系列 数据 处 理 及 加 工 技术 开发 出 新 的 知识 产品 ， 
古籍 数字 化 的 概念 向 着 更 深 的 “知识 域 "迈进 。 当 十 
籍 数字 化 发 展 到 新 阶段 后 ,就 古籍 整理 与 研究 者 而 言 ， 
对 古籍 完成 数字 文本 转换 之 后 的 海量 数据 进行 深度 的 
知识 加 工 ,成 为 绕 不 开 的 课题 。 为 此 ,笔者 拟 对 近 10 
年 来 古籍 数字 化 研究 进行 总 结 ,分 析 古 籍 数字 化 研究 
的 总 体 特征 ,存在 问题 及 内 在 驱动 力 , 并 结合 人 文科 学 
研究 对 古籍 数字 化 产品 功能 需求 的 特点 ,探讨 古籍 数 


字 化 未 来 的 发 展 方向 ,为 古籍 整理 和 人 文 社会 科学 相 
关 研 究 提供 参考 和 借鉴 。 


2 古籍 数字 化 研究 概况 (2009 -2019 ) 


2.1 相关 的 期 刊 论 文 基本 情况 

笔者 利用 CNKI 数据 库 ,来源 选择 为 期刊", 字段 
选 为 “主题 ” ,一 次 检索 词 为 “上 古籍 “典籍 " “善本”“ 古 
文 “ 古 代 文 献 "“ 上 古籍 整理 "古籍 保护 ”, 二 次 检索 词 
为 “数字 化 "“ 电 子 化 “计算 机 ”“ 数 据 库 ” ,组 配方 式 
均 为 逻辑 或 ,时 间 限 定 在 2009 年 至 2019 年 , 勾 选 同 义 
词 扩展 ,检索 日 期 为 2019 年 7 月 1 日 , 共 命 中 1053 条 
结果 。 通 过 筛选 .剔除 后 共 得 到 759 条 相关 结果 ,然后 
运用 CiteSpace 软件 工具 对 所 得 结果 进行 计量 和 可 视 
化 分 析 , 得 到 作者 合作 网 络 图 和 关键 词 共 现 图 , 见 图 1 
和 图 2。 

作者 合作 网 络 图 能 够 反映 领域 内 重要 的 研究 贡献 
者 及 研究 者 之 间 的 联系 。 在 作者 合作 网 络 图 中 , 节点 
的 大 小 代表 作者 的 发 文 数 量 。 从 图 1 可 以 看 出 ,古籍 
数字 化 研究 的 作者 分 布 较为 分 散 ,说 明 近 10 年 来 该 主 
题 研究 者 的 来 源 背景 比较 复杂 ,研究 的 方向 也 较为 分 
散 ; 从 发 文 数量 来 看 , 葛 怀 东 、 毛 建 军 , 张 文亮 等 学 者 位 
居 前 列 ;还 有 部 分 研究 者 是 以 合作 的 方式 进行 学 术 探 
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图 1 古籍 数字 化 研究 的 作者 合作 网 络 


索 ,例如 李兵 , 符 永 驰 . 王 蕊 等 ,这 些 学 者 均 来 自 同 一 研 
究 机 构 , 且 研 究 内 容 多 以 中 医药 古籍 为 主 。 分 散 的 作 
者 国 络 图 从 侧面 说 明了 两 个 问题 :四 研究 者 来 自 于 不 
同 答 学 科 青 景 , 印 证 了 现 阶段 十 籍 数字 化 研究 的 多 学 
秋 红 质 , 涉 及 到 图 书 情报 .文史 .计算 机 领域 ,但 不 同类 
现 罗 研究 机 构 之 问 的 合作 较 少 ,学 科 交 叉 的 性 质 仍 有 
传 节 强 ;@ 研 究 者 正在 努力 发 所 新 的 课题 ,因而 研究 主 
题 显 得 较为 分 散 ,当前 并 未 形成 一 个 稳定 ,完整 的 研究 
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图 2 古籍 数字 化 研究 的 关键 词 共 现 


关键 词 体现 出 文章 所 要 表达 的 核心 主题 和 主要 内 
容 。 通 过 关键 词 共 现 分 析 , 可 以 对 研究 领域 的 主题 进 
行 分 析 。 在 关键 词 共 现 图 中 ,节点 的 大 小 代表 关键 词 
的 频次 ,关键 词 出 现 频次 越 多 ,对 应 的 节点 就 越 大 。 节 
点 之 间 的 连 线 则 表示 共 现 关系 ,其 粗细 表示 的 是 共 现 
强度 。 图 2 将 共 现 次 数 较 多 的 关键 词 和 一 些 特殊 的 关 


键 词 分 别 用 方形 框 和 椭圆 框 标记 了 出 来 。 结 合 图 2 及 
调研 相关 文献 ,笔者 归纳 出 近 10 年 来 古籍 数字 化 研究 
主要 集中 在 以 下 6 个 方面 : 

(1) 古 籍 数字 化 概念 及 古籍 数字 化 现状 研究 。 此 


类 论文 数量 偏 多 ,说 明 学 界 比 较 关注 古籍 数字 化 的 基 
本 理论 问题 ,同时 注重 与 实践 相 结 合 。 对 于 古籍 数字 
化 概念 的 探讨 始 于 20 世纪 90 年 代 中 后 期 ,至 今 没有 
间断 。 人 们 对 古籍 数字 化 的 认识 , 随 着 古籍 数字 化 
的 发 展 而 不 断 深入 ,这 个 过 程 大 致 经 历 了 古籍 存储 
介质 的 转换 .文本 组 织 与 检索 .数据 加 工 与 知识 服务 
3 个 阶段 。 对 古籍 数字 化 现状 的 研究 ,多 是 对 古籍 数 
字 化 进程 .问题 .对策 .趋势 等 方面 的 总 结 和 分 析 , 代 
表 性 论文 有 《中 文 古 籍 数字 化 的 现状 与 意义 》 《我 
国 古 籍 数字 化 进展 与 研究 述评 》2 《中 国 大 陆地 区 十 
籍 数字 化 问题 及 对 策 》2 《古籍 数字 化 的 困 局 及 应 对 
策略 》” 等 。 

(2 ) 与 古籍 保护 相关 的 古籍 数字 化 研究 。 视 古籍 
数字 化 为 古籍 再 生性 保护 的 一 种 有 效 手 段 ,并 展开 相 
应 的 研究 ,代表 性 的 论文 有 《古籍 保护 与 开发 的 策略 与 
建议 》《 古 籍 数字 化 的 保 真 问题 》“ 《数字 化 生存 下 
的 历史 文化 资源 保护 与 开发 研究 一 一 以 陕西 为 中 
心 )"《 数 字 人 文 时 代 图 书馆 古籍 文献 资源 的 数字 化 
长 期 保存 机 制 探讨 》5 等 。 

(3 ) 与 图 书馆 业务 相关 的 古籍 数字 资源 建设 研 
究 。 主 要 涉及 各 类 型 古籍 数据 库 的 开发 .古籍 数字 资 
源 整合 .古籍 数字 资源 共 建 共享 等 问题 。 图 书馆 作为 
古籍 收藏 ,管理 .开发 与 利用 的 主体 ,与 其 古籍 数字 化 
工作 相关 的 研究 主要 围绕 古籍 数字 资源 建设 展开 , 代 
表 性 论文 如 《古籍 书目 数据 库 的 标准 与 评价 研究 》”” 
《我 国 古籍 书目 数据 库 建 设 标准 规范 探讨 )"《 古 籍 数 
字 资 源 库 发 展 趋势 探讨 )"《 古 籍 数字 化 与 共 建 共 
享 )'" 必 图 书馆 古籍 数字 资源 整合 研究 ) 《古籍 资源 
聚合 研究 )"“ 等 。 另 外 ,古籍 版 本 数据 库 和 专题 知识 
库 的 建设 也 引起 了 学 者 们 的 关注 ,如 《基于 Unicode 的 
中 国 蒙古 文 古籍 版 本 数据 库 的 构建 )”《 论 古籍 版 本 
数据 库 建设 》 《中 医 古 籍 知识 库 的 发 展现 状 及 古籍 
养生 知识 库 的 构建 "等 。 

(4) 专 类 古籍 的 数字 化 研究 。 涉 及 中 医药 古籍 、 
少数 民族 古籍 .地 方 文献 . 谱 内 方志、 拓片 等 的 数字 化 
问题 ,如 《中 医 古 籍 数 字 化 整理 方案 研究 )"“ 《数字化 
家 谱 的 研究 与 实现 ) 《抄写 本 方志 古籍 数字 化 整理 
与 实践 》2 《国家 图 书馆 石刻 拓片 的 数字 化 》2 《蒙古 
文 资源 数字 化 共 建 共享 保障 体系 研究 》2 《中医 古 籍 
数字 化 建设 及 甚 平台 设计 和 实现 》2 等 。 这 类 研究 多 
是 从 文献 保护 和 文化 传承 的 视角 展开 的 ,就 古籍 数字 
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化 技术 本 身 而 言 ,并 无 多 少 突破 。 

(5) 古籍 数字 化 协作 机 制 研究 。 选 题 重复 ,缺少 
规划 等 问题 是 长 期 困扰 古籍 数字 化 的 一 个 问题 ,已 有 
不 少 学 者 意识 到 ,必须 通过 国家 层面 的 机 制 创 新 来 角 
决 这 一 难题 。 这 方面 代表 性 的 论文 有 《对 现 阶段 古籍 
数字 化 的 思考 一 兼 论 古籍 数字 化 国家 行为 的 重要 
性 》2 《古籍 数字 化 工作 统筹 协调 机 制 的 构建 》2《 斌 
论 古 籍 数字 化 的 国家 宏观 政策 体系 》25《 中 文 古籍 数 
字 化 的 主体 构成 及 协作 机 制 初探 ) 等 。 

(6) 古 籍 数字 化 与 数字 人 文 相 结合 的 研究 ,包括 
关联 数据 .知识 挖 气 、 地 理 信息 系统 (GIS) .知识 组 织 
等 。 近 5 年 来 ,这 类 论文 有 逐年 增多 的 趋势 ,预示 着 古 
籍 数字 化 研究 已 进入 面向 知识 服务 的 新 阶段 。 代 表 性 
的 论文 如 《命名 实体 识别 在 方志 内 容 挖掘 中 的 应 用 研 
和 93" 《“ 数 字 人 文 "内 涵 与 古籍 数字 化 的 深度 开 
发 NP “数字 人 文 "与 历史 地 理 信息 化 研究 ) 《基于 
Cis 的 中 国 十 籍 地 理 信息 系统 研究 )”" 《面向 数字 人 


历史 文献 的 数字 化 .数据 化 与 文本 挖掘: 以 中 国 地 方 

9 文献 数据 库 为 例 ) 《基于 本 体 和 XML 的 注 玻 文 
献 殉 结 构 化 知识 表示 》" 《中 国 历史 地 理 关联 数据 在 
图 塌 馆 数字 人 文 项 目 中 的 开放 应 用 研究 )”” 等 。 在 中 
医 震 籍 的 数字 化 研究 方面 ,对 知识 的 挖掘 和 重组 取得 
晶 目 的 成 果 ,如 《基于 本 体 论 构建 中 医 古籍 知识 


究 9$3* 《基于 本 体 的 中 医学 术 传承 脉络 构建 》 史 等 。 
2.2 ”相关 的 国家 社 科 基金 项 目 基本 情况 

笔者 利用 国家 社会 科学 基金 项 目 数据 库 "" ,将 时 
间 范 围 设 定 在 2009 - 2018 年 ,学 科 类 别 限定 在 “图 书 
馆 .情报 与 文献 学 ” , 检 得 与 古籍 数字 化 相关 的 研究 项 
目 54 项 。 从 立项 数量 来 看 ,整体 呈 逐 年 上 升 趋势 ,其 
中 2009 年 最 少 , 只 有 1 项 ;2017 年 最 多 ,达到 13 项 。 
从 项 目 类 型 来 看 ,西部 项 目 最 多 ,为 23 项 , 占 比 
42. 59% ;其 次 是 一 般 项 目 21 项 , 占 比 38.89% ;青年 项 
目 9 项 , 占 比 16.67% ;重大 项 目 1 项 , 占 比 1.85% .从 
项 目 研究 的 主题 分 布 来 看 ,大 致 分 为 以 下 几 类 : 

(1) 少 数 民族 古籍 和 中 医药 古籍 的 抢救 性 整理 与 
保护 。 此 类 项 目 数量 最 多 , 计 有 21 项 ,典型 的 如 “布依 
族 象 形 文字 古越 书 价值 及 其 资源 抢救 ,建设 与 开发 利 
用 研究 "(10XTQ010) “蒙古 民族 文献 价值 及 其 文献 资 


源 建设 研究 ”(10XTQ012) “云南 傣族 医药 古籍 文献 整 
理 及 其 基础 数据 库 建 设 研究 ”(11CTQ041) “撒拉 族 文 
献 资料 数据 库 的 建设 研究 ”(11XTQ011)、“ 四 川南 派 茂 
医药 古籍 文献 的 抢救 性 挖 据 整理 及 数据 库 人 研究 ” 
(13XTQ012) “青海 地 区 藏医 药 上 古籍 文献 收集 、 整 理 与 
数字 化 研究 ”(16BTQ051)“ 湘 黑 桂 边区 侗 医药 古籍 文 
献 收集 ` 整 理 及 数字 化 研究 ”(17CTQ017 ) “存世 宁夏 
旧 方 志 数 字 化 整理 研究 ”(18XTQ007 ) 等 。 

(2) 口 述 历史 、 特 殊 档 案 及 非 物质 文化 遗产 保护 
相关 的 数字 化 项 目 。 这 类 项 目 严格 地 说 不 属于 古籍 数 
字 化 项 目 , 但 属 历史 文献 的 范畴 , 故 放 在 一 起 统计 。 此 
类 项 目 计 有 15 项 ,如 “云南 少数 民族 口述 文献 价值 及 
其 数字 化 语音 库 建设 "(10CTQ015 ) “白族 口 承 文艺 非 
物质 文化 遗产 调查 及 专题 数据 库 建设 ”(12CTQ018 ) 、 
“历代 和 孔 府 档案 文献 集成 与 研究 及 全 文 数据 库 建设 ” 
(13&ZD108 )“ 清 代 莱 事 汉 文 原 批 档案 文献 汇编 .整理 
与 数字 化 建设 "(16BTQ045 ) “濒危 口头 诗 学 青海 撤 拉 
族 “ 玉 尔 ” 的 数字 化 保护 与 传承 研究 ”(17XTQ011 ) 、 
“濒危 非 物 质 文 化 遗产 的 青海 土族 “ 道 拉 ' 的 传承 与 数 
字 化 保护 研究 ”(18BTQ035 ) 等 。 自 2016 年 起 ,国家 社 
会 科学 基金 项 目 明显 加 大 了 对 少数 民族 地 区 口述 历史 
和 非 物 质 文化 遗产 的 保护 力度 。 

(3) 专 题 研 究 或 专 类 上 古籍 的 数字 化 项 目 。 此 类 项 
目 计 有 14 项 。 在 专题 研究 方面 ,有 的 探讨 古籍 数字 化 
理论 问题 ,如 ”文献 整理 学 术 传统 在 古籍 数字 化 中 的 价 
值 实现 研究 ”(17BTQ009) “图 书馆 古籍 文献 的 数字 人 
文 开 发 与 应 用 模式 研究 ”(17XTQ003 ) 等 ;有 的 探讨 古 
籍 数字 化 产业 发 展 问 题 , 如 “我 国 台 湾 地 区 数位 典藏 产 
业 链 建 置 研 究 17CTQ033”; 有 的 致力 于 某 类 古籍 的 数 
字 化 平台 建设 ,如 “越南 与 中 国 南海 地 名 考证 及 历史 地 
理 信息 平台 建设 研究 ”(18BTQ048 ) ;有 的 探讨 古籍 数 
字 化 的 具体 技术 问题 ,如 “面向 数字 出 版 的 蒙古 文字 形 
规范 问题 研究 ”(17XTQ001 ) “基于 典籍 的 中 华 传统 文 
化 知识 表达 体系 自动 构建 方法 研究 ”(18BTQ063 ) “ 微 
州 文书 分 类 法 与 元 数据 标准 设计 研究 ”(12CTQ007 ) 、 
“基于 关联 数据 的 南海 水 下 文化 遗产 文献 资源 共享 和 
可 视 化 检索 研究 ”(17CTQ004) “基于 方志 类 典籍 的 地 
标 农 产品 挖掘 与 组 织 研究 ”(18CTQ011 ) 等 。 专 类 古籍 
的 数字 化 通常 是 为 某 一 领域 的 专题 研究 服务 的 ,具有 
很 强 的 应 用 性 ,如 “四 库 全 书 人 研究 资源 数据 库 建设 ” 
(09BTQ017) “青海 省 三 江 源 区 藏 传 佛教 寺院 特色 数 
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据 库 建设 研究 ”(10XTQ013 ) “湖南 碑刻 整理 研究 和 数 
据 库 建设 (11XTQ010) “民国 以 前 云南 水 资料 整理 及 
数据 库 建设 (13BTQ041) “存世 宁夏 旧 方志 数字 化 整 
理 研究 ”(18XTQ007 ) 。 

(4) 单 书 的 古籍 数字 化 研究 。 此 类 项 目 计 有 4 项 ， 
如 “ 楚 辞 文献 语义 化 研究 ”10BTQ031)、“ 基 于 《 茶 教 
大 藏 经 . 丹 珠 尔 》 的 词汇 计量 研究 ”(12CTQ020 ) 、 
“《 秦 简 书 法 大 字典 》 创 编 及 数字 化 应 用 研究 ” 
(12XTQ009) 、《 读 史 方 僵 纪 要 》 地 名 考证 及 地 理 信息 
系统 平台 建设 研究 ”17BTQ038 ) 。 


3 古籍 数字 化 研究 的 总 体 特 征 和 存在 


问题 


T 
wm 


情况 的 分 析 , 笔 者 认为 , 近 
本 上 呈现 以 下 三 大 特征 : 


类 古籍 保护 和 图 书馆 古籍 资源 建设 类 的 古籍 数 
研究 占 了 绝 大 多 数 。 换 句 话说 ,当前 我 国 古 籍 数 
字 化 仍 是 以 保护 和 传承 古籍 的 内 容 文本 为 主要 任务 ， 
遵循 的 是 古籍 的 再 生性 保护 思路 。 这 在 那些 具有 浓郁 
的 语族 特色 .地 区 特色 文化 特色 的 古籍 身上 体现 得 尤 
为 突出 。 国 家 社 科 基金 项 目 中 与 古籍 数字 化 相关 的 
“西部 项 目 ”数量 最 多 ,除了 政策 倾斜 的 因素 之 外 ,更 
多 了 的 是 因为 西部 地 区 这 3 类 特色 古籍 较 多 , 亟 需 得 到 
保护 。 仅 从 技术 上 而 言 ,此 类 研究 也 许 谈 不 上 有 多 大 
创新 ,但 从 文献 保护 和 文化 传承 的 角度 而 言 , 则 意义 非 
同一 般 。 

(2) 上 古籍 数字 化 研究 领域 不 断 拓展 ,学 科 化 趋势 
日 益 明 显 。 如 果 把 古籍 数字 化 的 研究 内 容 整体 比 作 一 
座 金 字 塔 ,那么 古籍 再 生性 保护 就 是 这 座 金 字 塔 的 塔 
基 。 在 塔 基 之 上 ,不 断 延 展 出 新 的 研究 领域 ,比如 古籍 
数字 化 基础 理论 .古籍 数字 资源 建设 .古籍 数字 资源 管 
理 古籍 数字 化 政策 .古籍 数字 化 技术 等 。 从 理论 到 实 
践 ,从 技术 到 政策 ,从 应 用 到 管理 ,古籍 数字 化 研究 伍 
然 可 以 构成 一 门 新 的 学 科 。 事实 上 ,古籍 数字 化 的 学 
科 建 设 问题 已 经 引起 了 部 分 学 者 的 关注 ,如 毛 建 军 从 
传统 目录 学 .版 本 学 校勘 学 研究 的 新 视野 ,探讨 了 电 
子 文献 学 的 研究 范畴 ; 葛 怀 东 对 古籍 数字 化 学 科 的 


研究 对 象 ,学科 性 质 作 了 初步 界定 ,并 提出 拟 以 数字 化 
古籍 整理 学 .中文 信息 处 理 技术 .古籍 数字 化 管理 理论 
作为 学 科 构建 的 基本 框架 ” 。 

(3) 古 籍 数字 化 研究 在 技术 和 理念 上 形成 了 以 知 
识 服 务 为 核心 的 思想 。 上 古籍 数字 化 不 论 如 何 发 展 ,其 
本 质 仍 属于 古籍 整理 的 范畴 。 传 统 的 古籍 整理 是 为 人 
文 社 会 科学 研究 提供 文本 和 语义 服务 ,在 数字 化 时 代 ， 
古籍 整理 进入 了 更 次 的 知识 层次 。 在 古籍 数字 化 这 座 
金字 塔 的 塔 尖 ,古籍 数字 化 技术 与 理念 指引 着 古籍 数 
字 化 发 展 的 方向 。 近 10 年 来 ,数字 技术 与 人 文 观 念 的 
结合 ,催生 了 以 知识 服务 于 人 文 社会 科学 研究 的 思想 ， 
使 得 古籍 数字 化 整理 不 再 局 限于 提供 准确 可 靠 、 可 理 
解 的 内 容 文本 ,而 是 提供 可 用 于 辅助 研究 的 知识 产品 。 
3.2 存在 问题 

除了 研究 论文 与 科研 项 目 之 外 ,具体 的 数字 化 产 
品 也 是 古籍 数字 化 研究 成 果 的 一 部 分 。 因 此 ,笔者 在 
对 研究 论文 和 科研 项 目 进行 统计 分 析 之 外 ,还 通过 网 
络 调 查 、 亲 身体 验 等 方法 ,考察 了 现 有 古籍 数字 化 成 果 
的 系统 功能 。 将 文献 调研 与 系统 功能 考察 结合 起 来 ， 
笔者 总 结 出 古籍 数字 化 研究 存在 以 下 不 足 : 

(1) 忽 视 了 对 用 户 需 求 的 调查 分 析 。 上 古籍 数字 化 
成 果 最 终 面 向 的 是 人 文 社会 科学 研究 者 及 古籍 爱好 者 
群体 。 古 籍 数 字 化 除了 运用 技术 手段 转录 古籍 内 容 、 
保护 古籍 本 映 外 ,更 重要 的 是 服务 学 术 研 究 。 当 前 的 
古籍 数字 化 成 果 究 竟 能 在 多 大 程度 上 满足 传统 学 术 研 
究 的 需要 ,是 很 值得 怀疑 的 ,因为 信息 技术 专家 对 人 文 
学 科研 究 的 特点 及 专业 知识 信息 需求 缺乏 深入 的 调查 
分 析 。 

(2) 未 能 构建 完整 的 古籍 数字 化 学 术 规范 。 古 籍 
数字 化 不 是 古籍 内 容 存储 介质 的 简单 转换 ,而 是 传统 
的 古籍 整理 在 数字 化 环境 下 的 合理 延伸 。 古 籍 整理 的 
理念 .方法 经 过 长 时 期 的 历史 沉 演 ,适应 了 传统 学 术 研 
究 的 需要 ,有 其 科学 合理 的 一 面 ,如 对 底 本 的 考 订 和 六 
选 .对 文字 的 校勘 .对 副 文本 的 处 理 等 。 因 此 ,古籍 数 
字 化 产品 必须 是 古籍 整理 的 成 果 , 必 须 符 合 古 籍 整理 
的 学 术 规范 。 然 而 时 至 今日 ,古籍 数字 化 在 文本 加 工 、 
技术 处 理 、 管 理 流程 等 方面 ,还 没有 建立 一 套 相应 的 规 
范 来 保障 古籍 数字 化 的 学 术 品 质 。 

(3) 对 古籍 整理 学 术 传 统 的 借鉴 力度 不 够 ,学 科 
合作 有 竺 加强。 我 国 的 古籍 整理 经 过 漫长 的 历史 积 
累 , 形 成 了 许多 优良 的 学 术 思 想 ,如 孔子 提出 的 “ 述 而 


133 


图 宫 情 报 三 作 


第 64 卷 第 6 期 2020 年 3 月 


ChinaXiv 合 作 期 刊 


不 作 ” 的 文献 整理 基本 原则 司马迁 提 出 的 文献 编纂 的 
“会 通 观 ”, 支 敏 度 提出 的 “ 百 虑 一 致 ,万 流 同 归 ” 的 版 
本 源流 考 订 思想 , 颜 之 推 提出 的 “ 观 天 下 书 未 遍 , 不 得 
刻下 肉 黄 ”的 校勘 学 思想 、 章 学 诚 提出 的 “ 辩 章 学 术 ， 
考 镜 源流 "的 目录 学 思想 等 。 这 些 学 术 思 想 是 与 古籍 
整理 相 适 应 的 ,对 今天 的 古籍 数字 化 实践 仍 具有 重要 
的 借鉴 意义 。 

(4) 忽 视 了 对 现 有 古籍 整理 成 果 的 数字 化 研究 。 
在 纸 本 文献 环境 下 ,前 人 已 经 做 了 大 量 的 古籍 整理 工 
作 , 留 下 了 丰富 的 古籍 整理 成 果 , 包 括 大 量 的 古籍 序 
践 ,书目 .类 序 、 提 要 以 及 编 繁 而 成 的 各 种 工具 书 , 如 职 
官 表 、 年 表 、 传 记 、 年 谱 , 学 案 、 类 书 等 。 这 些 成 果 本 来 
就 是 用 以 辅助 传统 学 术 研 究 的 ,从 提高 服务 效率 的 角 
度 张 讲 ,对 已 有 古籍 整理 成 果 的 数字 化 将 起 到 事 半 功 
们 网 效果 。 然 而 , 现 有 的 古籍 数字 化 产品 较 少 将 这 类 
专 笑 整理 成 果 和 入 其 中 ,造成 了 学 术 资 源 的 浪费 。 
(5) 案 例 研究 所 涉 古 籍 范 围 有 限 。 当 前 的 古籍 数 
字 花 研究 已 经 进入 数 据 整 理 阶 段 , 本 体 的 构建 语义 的 
光 驶 .知识 的 挖掘 和 可 视 化 技术 ,已 大 量 应 用 到 古籍 数 
绽 亿 领域 。 但 从 应 用 的 古籍 范 围 来 看 ,主要 局 限于 医 
绽 灾 业 家 谱 类 古籍 ,而 像 历代 笔记 小 说 .各 家 书目 、 
关注 方志 等 其 他 有 特点 的 古籍 类 别 还 较为 少见 ,这 需 
要 三 今 后 的 研究 中 加 以 拓展 。 另 外 ,从 实践 来 看 ,对 古 
籍 捕 识 深度 开发 的 成 果 还 不 是 很 多 ,尤其 缺乏 集 各 种 
功能 于 一 体 的 开放 共享 式 的 古籍 数字 化 平台 。 


S 面 向 用 户 的 知识 服务 :未 来 古籍 数字 
化 研究 趋势 探讨 


如 前 所 述 ,古籍 再 生性 保护 是 当前 古籍 数字 化 这 
座 金字 塔 的 塔 基 ,折射 的 是 古籍 数字 化 的 现实 情况 ,而 
古籍 数字 化 技术 与 理念 则 是 这 座 金字 塔 的 塔 尖 ,指引 
的 是 古籍 数字 化 发 展 的 未 来 方向 。 当 现 有 的 各 大 图 书 
馆 收 藏 的 珍本 ,孤本 及 普通 古籍 ,以 及 地 方 特色 的 少数 
民族 古籍 都 完成 了 数字 文本 的 转换 ( 即 再 生性 保护 ) 
之 后 ,对 古籍 数字 资源 的 深加工 就 成 为 未 来 古籍 数字 
化 研究 的 必然 课题 。 就 目前 古籍 数据 加 工 的 技术 和 理 
念 来 看 ,面向 用 户 的 知识 服务 是 未 来 古籍 数字 化 研究 
的 趋势 ,而 这 也 是 由 学 术 传 承 ,用户 需 求 及 信息 技术 发 
展 为 内 在 驱动 力 的 。 
4.1 学 术 传承 驱动 下 的 知识 服务 

中 华文 化 最 大 的 一 个 特性 在 于 其 传承 性 。 对 于 十 


籍 而 言 ,一 方面 它 承 载 的 知识 内 容 是 历代 学 术 研 究 的 
成 果 , 具 有 传承 性 ; 另 一 方面 ,古籍 本 身 是 历代 学 者 整 
理 和 出 版 的 产物 ,在 长 期 实践 中 形成 的 文献 整理 思想 
和 方法 体系 ,也 是 学 术 传 承 的 一 部 分 。 对 于 古籍 数字 
化 而 言 , 一 方面 要 保存 古籍 的 知识 内 容 ,传承 历代 学 术 
研究 的 成 果 , 男 一 方面 要 继承 和 发 扬 古 代 文 献 整 理 的 
优良 学 术 传 统 。 

而 从 知识 生产 的 逻辑 来 看 ,任何 学 术 研 究 都 肩负 
着 知识 生产 ,学术 创新 的 任务 ,而 在 推进 知识 生产 的 过 
程 中 ,研究 者 们 最 先 做 的 工作 都 是 文献 回顾 。 它 指 的 
是 对 到 目前 为 止 的 .与 某 一 研究 问题 相关 的 各 种 文献 
进行 系统 查阅 和 分 析 , 以 了 解 该 领域 研究 状况 的 过 程 。 
或 者 说 ,就 是 一 个 系统 识别 寻找, 考察 和 总 结 那些 与 
我 们 的 研究 有 关 的 文献 的 过 程 “ 。 文 献 回顾 需要 在 
既 有 文献 和 新 的 知识 生产 之 间 建 立 内 在 的 学 术 联 系 : 
一 是 通过 清理 既 有 文献 ,为 新 的 知识 生产 过 程 建 立 一 
个 学 术 对 话 点 ;二 是 通过 文献 清理 ,发 现 新 的 研究 空 
间 , 从 而 建立 一 个 学 术 推 进 点 “ 。 它 除了 推动 知识 生 
产 和 学 术 创新 外 , 另 一 个 关键 点 在 于 理 清 学 术 源 流 、 促 
进 学 术 传承 。 在 传统 文献 环境 下 ,古人 通过 对 前 代 文 
献 的 系统 整理 来 完成 对 前 代 学 术 的 总 结 , 几 成 惯例 ,如 
西汉 刘 向 等 学 者 对 政府 藏书 的 整理 ,通过 “条 别 篇 目 ， 
撮 其 指 意 ”, 扎 成 4 别 录 》; 刘 坎 类 分 群 书 , 编 成 4 七 略 》， 
从 而 完成 对 先秦 以 来 学 术 的 系统 总 结 。 历 代 大 型 类 书 
(如 《永乐 大 典 》) 和 综合 性 丛书 ( 如 《四 库 全 书 》) 的 纺 
符 , 也 是 对 一 代 学 术 的 系统 梳理 和 和 集成。 

在 数字 环境 下 ,现代 学 者 对 承载 古人 思想 和 智慧 
的 古籍 文本 进行 存储 介质 的 转换 ,语义 的 解析 内容 的 
组 织 .知识 的 挖掘 等 工作 ,与 古人 对 前 代 文 献 的 系统 整 
理 的 本 质 是 一 脉 相 承 的 ,只 是 过 程 和 方法 上 有 所 不 同 
而 已 。 在 对 古籍 文本 内 容 进 行 整理 的 同时 ,古籍 整理 
的 学 术 传统 也 在 古籍 数字 化 中 得 以 传承 ,如 在 古籍 文 
本 的 转录 过 程 中 ,对 文字 的 原始 特征 及 各 种 眉 批 , 夹 
住 点 评 予 以 保留 ,体现 了 ”* 述 而 不 作 ” 的 原则 ;对 不 同 
类 型 的 古籍 数字 资源 及 各 种 辅助 人 文学 科研 究 功 能 的 
集成 ,体现 了 “会 通 ” 的 理念 ;而 通过 语义 分 析 和 关联 ， 
实现 文本 的 自动 聚 类 ,甚至 利用 知识 挖掘 的 方法 ,揭示 
古籍 文本 中 隐 含 的 丰富 知识 和 不 同 的 学 科 主 题 内 容 ， 
理 清 各 家 思想 ,探究 学 术 源流 , 冬 承 了 辨 章 学 术 , 考 镜 
源流 ”的 思想 。 
无 论 是 古代 的 文献 生产 与 整理 活动 ,还 是 当代 信 
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息 环境 下 的 古籍 数字 化 实践 ,从 本 质 上 讲 都 是 知识 生 
产 与 传播 的 中 间 环 节 。 知 识 生产 的 主体 根据 自身 的 社 
会 实践 经 历 ,将 个 人 经 验 予 以 提炼 和 升华 ,输出 知识 成 
果 。 但 经 过 一 段 时 间 的 传播 后 ,由 于 传播 过 程 中 的 不 
可 避免 的 信息 失真 ,后 人 必须 对 前 人 的 知识 成 果 进 行 
整理 ,发 所 和 吸纳 其 可 利用 的 成 分 ,从 而 产生 新 的 认 知 
和 研究 主题 。 如 此 循环 往复 ,构成 了 以 知识 为 核心 的 
学 术 传 承 过 程 。 

4.2 ”用户 需 求 驱动 下 的 知识 服务 

回顾 古籍 数字 化 研究 的 发 端 到 全 面 开展 的 过 程 ， 
再 结合 近 10 年 来 的 研究 现状 ,笔者 发 现 ,服务 于 工作 
实践 .解决 实际 问题 .满足 用 户 在 学 术 研 究 中 的 知识 信 


4.3 信息 技术 发 展 驱动 下 的 知识 服务 

信息 技术 作为 一 种 工具 ,在 科学 认 知 科学 研究 中 
发 挥 着 重要 的 功能 。 它 不 仪 能 带 来 研究 效率 的 提高 ， 
还 能 拓宽 研究 思路 ,尤其 是 数字 技术 与 传统 学 术 研 究 
相 结合 ,甚至 带 来 研究 方法 的 变 音 ,数字 人 文 就 是 最 好 
的 例子 。 上 古籍 数字 化 既是 关于 古籍 整理 的 研究 ,也 是 
关于 信息 技术 应 用 的 研究 。 只 有 把 握 好 信息 技术 的 发 
展 导向 ,才能 认 清 古籍 数字 化 研究 的 未 来 趋势 。 

从 信息 技术 的 发 展 历程 来 看 ,古籍 数字 化 经 历 了 
古籍 文本 的 数字 化 转换 .古籍 内 容 的 组 织 加 工 .古籍 知 
识 的 发 据 和 可 视 化 呈现 3 个 阶段 。 第 一 阶段 所 用 的 技 
术 方法 包括 文字 录入 影像 扫描 .OCR 识别 等 ,其 中 也 
涉及 汉字 的 简 繁 转换 、 俗 体 字 和 蜡 体 字 的 识别 .字符 集 
标准 等 技术 问题 ;第 二 阶段 所 用 的 技术 方法 包括 运用 


网 网 识 的 按 气 和 再 组 织 的 过 程 ,这 个 不 断 递 进 的 过 程 
也 是 用 户 需求 不 断 发 展 的 结果 。 


杰 个 息 浏览 “内 容 检索 与 筛选 “阅读 显示 ”辅助 工 


EN 
pd 


EN 
上 县 > 个 性 化 设置 "和 “知识 增值 利用 ”6 个 功能 模块 及 


具 傈 的 33 个 功能 点 ,利用 线 下 访谈 、 线 上 问卷 的 方式 ， 


人 
A 
A 
x 


夭 想 字 化 产品 功能 进行 了 调查 ,然后 引入 日 本 狩 野 纪 


计算 机 进行 分 类 标 引 ` 书 目 编制 .关键 词 索引 ,以 及 自 
动 标 点 .校勘 注释、 翻译 、 编 纂 等 ,主要 满足 用 户 对 特 
定 主题 或 学 科 领 域内 的 古籍 原文 内 容 及 语义 阐释 的 需 
求 。 现 阶段 , 随 着 信息 技术 的 进一步 发 展 , 古 籍 数字 化 
越 来 越 重视 古籍 知识 的 发 据 和 可 视 化 呈现 ,这 种 以 海 
量 的 古籍 文本 数据 为 对 象 的 知识 加 工 服 务 ,打破 了 学 
科 与 学 科 、 书 与 书 之 间 的 界限 ,技术 上 主要 采用 文本 聚 


类 ,数据 挖掘 、 本 体 构 建 , 社 会 网 络 分 析 、 地 理 信息 系 
统 .知识 图 谱 等 方法 。 


从 目前 情况 来 看 ,面向 知识 服务 的 信息 技术 主要 
应 用 于 中 医药 、 农 业 类 的 古籍 数字 化 ,如 《 胸 兽 心痛 古 
代 文 献 用 药 规律 及 聚 类 分 析 》”“《 基 于 古籍 文献 挖掘 


昭 驳 授 的 KANO 模型 ,对 各 个 模块 的 功能 与 用 户 满意 


度 之 间 的 关系 进行 评测 。 结 果 表 明 ,“ 基 本 信息 浏览 ” 
“内 容 检索 与 般 选 "和 ”阅读 显示 ”这 3 个 功能 模块 属 
于 基本 需求 和 期 望 型 需求 ,而 ”知识 增值 利用 "属于 魅 
力 型 需求 。“ 知 识 增值 利用 ”功能 包括 联机 字典 、 纪 年 
换算 、 词 / 字 频 统计 、 社 会 网 络 分 析 、 文 本 聚 类 、 知 识 关 
联 、 内 容 可 视 化 .地 理 空间 展示 等 具体 功能 。 上 古籍 数字 
化 产品 如 果 能 提供 这 些 功能 ,将 会 大 大 提升 用 户 的 满 
意 度 。 目 前 ,古籍 数字 化 产品 在 “基本 信息 浏览 “内 
容 检索 与 筛选 "和 "阅读 显示 ”功能 方面 已 经 基本 实 
现 , 随 着 技术 的 发 展 、 研 究 的 深入 ， 知 识 增值 利用 "这 
一 部 分 功能 逐渐 从 用 户 的 魅力 型 需求 转向 期 望 型 需求 
或 者 基本 型 需求 。 因 此 ,对 古籍 文本 转换 后 的 数据 进 
行 深度 知识 挖掘 、 加 工 和 可 视 化 展示 ,为 用 户 提供 知识 
服务 ,将 是 古籍 数字 化 研究 的 重点 内 容 。 


的 头痛 中 医 病 性 证 素 特征 研究 )"“”《 基 于 中 医 古 籍 数 
据 挖掘 的 不 育 症 病名 源流 考 辨 ;“《 基 于 数据 挖掘 技 
术 分 析 古 籍 中 风 病 脸 穴 处 方 规律 ”1《 基 于 本 体 的 脾 
脏 象 理论 知识 体系 构建 研究 》” 《基于 中 医 骨 伤 古籍 
本 体 的 语义 检索 研究 》” 《农业 古籍 本 体 构建 及 应 
昌 》'*《 农 业 古 籍 本 体 的 构建 及 其 检索 机 制 研究 》 "3 
等 。 另 外 ,在 方志 .地 理 、 史 书 类 古籍 方面 ,也 有 不 少 成 
果 , 如 《方志 类 古籍 中 物产 名 与 别名 关系 的 可 视 化 一 一 
基于 社会 网 络 分 析 技术 视角 》” 《基于 GIS 的 中 国 古 
籍 地理 信 息 系统 研究 》 《大 规模 古籍 文本 在 中 国史 
定量 研究 中 的 应 用 探索 》' 等 。 其 他 领域 面向 知识 服 
务 的 古籍 数字 化 研究 还 有 很 大 的 空间 。 

目前 ,古籍 数字 化 在 古籍 知识 价值 的 拓展 阶段 ,出 
现 了 由 古籍 数字 资源 库 向 知识 共享 平台 转变 的 新 动 
向 。 这 些 知 识 共 享 平 台 , 除 了 整合 大 量 的 古籍 数字 资 
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源 .提供 浏览 和 检索 功能 之 外 ,还 建立 了 相应 的 知识 社 
区 ,提供 知识 分 享 、 主 题 讨 论 等 功能 。 如 “ 籍 合 网 ” 创 
建 了 线 上 知识 社区 “古籍 圈 ” ,用 户 在 圈 内 可 以 自由 提 
问 \ 发 言 \ 组 成 团体 ,对 相关 问题 进行 讨论 ,互助 解决 问 
题 , 还 可 以 分 享 学 术 随 便 、 研 究 心得 “中 国 哲 学 书 电 
子 化 计划 (CTP) "除了 提供 原 典 资料 库 、 原 典 影 印 本 、 
内 部 字典 、 高 级 搜索 功能 外 ,还 提供 历代 注释 本 显示 、 
当代 研究 资料 库 、 后 设 资料 系统 语词 分 析 表 、 相 似 段 
落 资料 等 高 级 功能 ,同时 可 以 在 讨论 区 提问 和 参与 相 
关 问 题 讨论 ,在 维基 区 共同 编辑 ,纠正 古籍 全 文中 的 错 
过 


5 结语 


一 古籍 数字 化 学 术 研 究 是 古籍 数字 化 实践 活动 的 先 
通过 对 近 10 年 来 发 表 的 与 古籍 数字 化 相关 的 学 


统 评 分 析 , 结 合 对 现 有 十 籍 数字 化 产品 功能 的 考察 和 
哥 体验 ,笔者 归纳 总 结 了 近 10 年 来 古籍 数字 化 研究 
总体 特征 和 存在 的 问题 ,并 从 学 术 传 统 的 传承 .用户 
诅 鸿 的 满足 ,技术 发 展 的 推动 3 个 方面 ,指明 面向 用 户 
的 知识 服务 是 未 来 古籍 数字 化 研究 的 趋势 。 古 籍 数字 
借 济 做 好 古籍 文化 遗产 保护 ,数字 资源 建设 工作 的 同 
时 3 根据 人 文 社会 科学 研究 的 特点 ,面向 专业 研究 者 
的 乡 识 需求 ,开发 出 更 多 辅助 人 文 社会 科学 研究 的 知 
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识 HHo 


参考 文献 ; 
[ 13 刘 伟 红 . 中 文 古 籍 数字 化 的 现状 与 意义 [可 . 图 书 与 情报 ,2009 
(4) :134 -137. 


[ 2 ] 朱 锁 玲 , 包 平 .我 国 古 籍 数字 化 进展 与 研究 述评 [ 了. 图 书馆 理 
论 与 实践 ,2009(9) :18 -21. 
[ 3 ] 高 娟 , 刘 家 真 . 中 国 大 陆地 区 古籍 数字 化 问题 及 对 策 [ 站 . 中 国 
图 书馆 学 报 ,2013(4) :110 -119. 

[4 ] 邵 正 坤 . 古籍 数字 化 的 困 局 及 应 对 策略 [J. 图 书馆 学 研究 ， 
2014(12 ) :32 -34. 
[5 ] 刘 家 真 , 程 万 高 .古籍 保护 与 开发 的 策略 与 建议 [ 
馆 学 报 ,2009(3) :15 -20. 

[6 ] 丁 侃 , 柳 长 华 .古籍 数字 化 的 保 真 问题 [J]. 中 医 文献 杂志 ,2009 
(2) :31 -33. 

[7 ] 赵 东 . 数字 化 生存 下 的 历史 文化 资源 保护 与 开发 研究 
西 为 中 心 [Dj]. 济南 :山东 大 学 ,2014. 

[8 ] 陈诚 . 数字 人 文 时 代 图 书馆 古籍 文献 资源 的 数字 化 长 期 保存 机 
制 探讨 [站]. 中 国 中 医药 图 书 情报 杂志 ,2019(3) :6 -9. 

[ 9 ] 毛 建 军 . 古籍 书目 数据 库 的 标准 与 评价 研究 [可 . 图 书馆 理论 与 


以 陕 


[20] 


[21] 


[22] 


[23] 


[24] 


[25] 


[26] 


[27] 


[28] 


[29] 


[30] 


[31] 


[32] 


[33] 


] 梁 爱 民 , 陈 荔 京 . 古籍 数字 化 与 共 于 


] 安 欢 等 . 中 医 古 籍 知识 库 的 发 展现 状 及 古籍 养生 


实践 ,2009(6 ) :30 -33. 


] 周 琳 洁 . 我 国 古籍 书目 数据 库 建 设 标准 规范 探讨 


设 ,2010(2):47 -50. 


与 研究 ,2011(2 ) :36 -39. 


[可 .图 书馆 建 


] 赵 葆 英 , 苏 沫 . 古籍 数字 资源 库 发 展 趋势 探讨 [ 中. 图 书馆 工作 


全 


2012(5) :108 - 112. 


] 萨 雷 . 图 书馆 古籍 数字 资源 整合 研究 [ 相 . 图 书 


116 -119. 


] 陈 士兵 . 古籍 资源 聚合 研究 [D]. 太原 :山西 大 学 
] 黄 飞龙 , 札 义 兰 . 基于 Unicode 的 中 国 蒙古 文 古籍 版 本 数据 库 


的 构建 [ 相 . 内 蒙古 民族 大 学 学 报 ,2009(3 ) :160 


77. 


[可 .西部 中 医药 ,2016(6) :158 - 159. 


] 李兵 . 中 医 古 籍 数 字 化 整理 方案 研究 [D]. 北京 :中 国 中 医 


学 院 ,2009. 


2011. 


共享 [ 站. 国家 民 


馆 ,2014 (4): 


,2018. 


—161. 


] 万 怀 东 . 论 古籍 版 本 数据 库 建设 [ J. 情报 探索 ,2012(7) :75 - 


知识 库 的 构建 


| 
详 


] 柯 洲 . 数字 化 家 谱 的 研究 与 实现 [Dj]. 武汉 :华中 师范 大 学 ， 


胡 以 涛 , 宋 叶 . 抄写 本 方志 古籍 数字 化 整理 与 实践 [J]. 图 书馆 


理论 与 实践 ,2014(8) :101 - 103. 


袁 玉 红 国家 图 书馆 石刻 拓片 的 数字 化 [J]. 图 书馆 理论 与 实 


践 ,2014(5) :17 -18. 


王 康 , 康 健 . 蒙古 文 资源 数字 化 共 建 共享 保障 体系 研究 [J]. 图 


书 情报 工作 ,2015 ,59(12) :39 - 43. 


曹 霞 , 常 存 库 , 裴 丽 中医 古 籍 数 字 化 建设 及 其 平台 设计 和 实 


现 [可 . 中 华 医学 图 书 情报 杂志 ,2016(3) :45 -47. 


李 玉 安 .对 现 阶段 古籍 数字 化 的 思考 [C1]// 第 


居中 国 十 籍 数 


字 化 国际 学 术 研 讨 会 论文 集 . 北京 :五 洲 传播 出 版 社 ,2011. 


陈 得 姐 . 古籍 数字 化 工作 统筹 协调 机 制 的 构建 [J 
学 报 ,2009(5 ) :47 -51. 

部 丽 红 . 试 论 古 籍 数字 化 的 国家 宏观 政策 体系 [J 
报 ,2010(4):39 -41. 

李 明 杰 , 命 优 优 . 中 文 古籍 数字 化 的 主体 构成 及 
[中 .图 书 与 情报 ,2010(1) :34 -44. 


]. 中 国 图 书馆 


]. 中 州 大 学 学 


协作 机 制 初探 


朱 锁 玲 . 命名 实体 识别 在 方志 内 容 挖掘 中 的 应 月 
京 :南京 农业 大 学 ,2011. 


研究 [Dj]. 南 


范 佳 .“ 数 字 人 文 ” 内 涵 与 古籍 数字 化 的 深度 开发 [中 . 图 书馆 


学 研究 ,2013 (3) :29 -32. 


陈刚 “数字 人 文 " 与 历史 地 理 信息 化 研究 [ 相 . 南京 社会 科学 ， 


2014(3 ) :136 -142. 
王 大 学 , 陈 照 , 杨 光辉 . 基于 GIS 的 中 国 古籍 地 理 
[中 .复旦 学 报 ( 自 科 版 ) ,2016(6) :684 -688. 
欧阳 剑 . 面向 数字 人 文 研究 的 大 规模 古籍 文本 可 
掘 [ 相 . 中国 图 书馆 学 报 ,2016(2) :66 -80. 


信息 系统 研究 


视 化 分 析 与 挖 


赵 思 渊 . 地 方 历史 文献 的 数字 化 .数据 化 与 文本 挖掘: 以 中 国 


136 


ChinaXiv 合 作 期 刊 


李 明 杰 , 张 纤 柯 ， 陈 梦 石 . 古籍 数字 化 研究 进展 述评 (2009 -2019) [站 . 图 书 情报 工作 ,2020,64(6) :130 - 137. 
地 方 历史 文献 数据 库 为 例 [J] . 清史 研究 ,2016(4) :26 -35. [47] 雷 玉 娇 . 基于 古籍 文献 挖 据 的 头痛 中 医 病 性 证 素 特征 研究 
[34] 马 创新 , 陈 小 荷 . 基于 本 体 和 XML 的 注 琉 文献 的 结构 化 知识 表 [D] . 郑州 :河南 中 医药 大 学 ,2018. 
示 [J]. 图 书馆 杂志 ,2017(8) :62 - 68. [48] 邢 益 涛 , 张 明 强 , 王 定 国 ,等 . 基于 中 医 古 籍 数据 挖掘 的 不 育 证 
[35] 夏 染 娟 . 中 国 历史 地 理 关联 数据 在 图 书馆 数字 人 文 项 目 中 的 开 病名 源流 考 辨 [J]. 河南 中 医 ,2018(4) :603 -605. 
放 应 用 研究 [J]. 中 国 图 书馆 学 报 ,2017(2) :40 -53. [49] 陈 楚 云 , 李 丽 霞 , 李 伟 林 , 等 . 基于 数据 挖掘 技术 分 析 古 籍 中 风 
[36] 孙 海 舒 , 符 永 驰 , 张 华 敏 ,等 . 基于 本 体 论 构建 中 医 古籍 知识 库 病 脸 穴 处 方 规律 [J]. 上 海 针 灸 杂志 ,2017(12) :1494 -1499. 
的 探索 [J] . 医学 信息 学 杂志 ,2011(3 ) :64 -68. [50 肉 家 鹏 , 王 彩 震 , 袁 东 超 ,等 . 基于 本 体 的 脾脏 象 理论 知识 体系 构 
[37] 丁 侃 . 基于 知识 元 的 中 医 古 籍 方剂 知识 表示 研究 [D]. 北京 :中 建 研究 [. 中 华中 医药 学 刊 ,2018 (2 ) :388 -292. 
国 中 医科 学 院 ,2012. [51] 林 尔 正 . 基于 中 医 骨 伤 古籍 本 体 的 语义 检索 研究 [D]. 福州 : 福 
[38] 许 有 雯 . 基于 温 病 古籍 知识 概念 语义 网 络 构建 研究 [DD]. 北京 :中 建 中 医学 院 ,2018. 
国 中 医科 学 院 ,2015. [52] 曹 玲 , 何 琳 . 农业 古籍 本 体 构建 及 应 用 [J]. 广西 师范 大 学 学 报 
[39] 丁 侃 , 张 丽 君 . 基于 本 体 的 中 医学 术 传承 脉络 构建 []]. 中 医 文 ( 自 科 版 ) ,2007(2) :1 -4. 
献 杂 志 ,2018(5) :32 -35. [53] 何 琳 , 曹 玲 . 农业 古籍 本 体 的 构建 及 其 检索 机 制 研究 [J]. 现代 
[40] 全 国 哲学 社会 科学 工作 办 公 室 . 国家 社 科 基金 项 目 数据 库 图 书 情报 技术 ,2006(12) :37 -53. 
[DB/OL]. [2019 -04 - 19]， http;//fz. people. com. en/skygb/ | [54] 李娜 , 包 平 .方志 类 古籍 中 物产 名 与 别名 关系 的 可 视 化 一- 基 
Sk 于 社会 网 络 分 析 技 术 视角 [可 . 图 书馆 论坛 ,2017(12):108 - 
[和 1 和 E 建 军 . 论 古籍 电子 文献 学 研究 范畴 的 确立 [中 . 图 书馆 理论 与 114. 
RY ,201009) .46 -48,88. [55] 王 大 学 . 基于 GIS 的 中 国 古 籍 地 理 信息 系统 研究 [J]. 复旦 学 报 
[人 了 葛 怀 东 . 古籍 数字 化 的 学 科 建 设 [J] . 科技 教育 创新 ,2012(1 ) : ( 自 科 版 ) ,2016(6) :684 -697. 
O156-157. [56] 欧阳 剑 . 大 规模 十 籍 文本 在 中 国史 定量 研究 中 的 应 用 探索 []， 
[4 和 风 笑 天 . 论 社会 研究 中 的 文献 回顾 [可 . 华中 师范 大 学 学 报 (人 大 学 图 书馆 学 报 ,2016(3) :5 -15. 
人 7 文 社 会 科学 版) ,2010(4) :40 -46. 
[和 ak 曙 ,高远 所 .知识 生产 与 文献 回顾 -从 技术 指引 到 意义 “| 作者 贡献 说 明 
Rn 李 明 杰 :提出 论文 选 题 ,设计 论文 结构 ,对 重要 观点 进 
[ 辐 除 丹 . 基于 KANO 模型 的 人 文学 科研 究 需求 对 古籍 数字 化 产品 en 
> 的 功能 调查 [DD]. 武汉 :武汉 大 学 ,2019 on 
[和 也 陆 一 作 , 李 园 自 , 毛 前 远 , 等 . 胸 痉 心痛 二 代 文献 用 药 规律 及 聚 | 张 引 林 :收集 论文 资料 , 扣 写 初 稳 ， 
(CG 类 分 析 []. 天 津 中 医药 ,2013(10) :629 -631. 陈 梦 五 :完成 共 现 图 谱 分 析 , 参 与 初稿 撰写 。 


Review on the Research Progress of the Digitization of Ancient Chinese Books (2009 -2019 ) 
Li Mingjie Zhang Xianke Chen Mengshi 
School of Information Management ，Wuhan University ，Wuhan 430072 

Abstract: | Purpose/significance | In order to explore the development trend of the research on the digitization 
of ancient books, it makes a systematic investigation on the research status of the digitization of ancient books in Chi- 
na. | Method/process| By using CiteSpace software, authors and key words of the research on the digitization of 
ancient books in the past decade were analyzed. Also, it analyzed the main research fields and subject distribution of 
papers and national social science fund projects. Authors made an investigation and had an experience on the func- 
tions of the existing digital products of ancient books. | Result/ conclusion | This paper summarizes 3 general charac- 
teristics and five main problems of the research of digitization of ancient books in recent ten years, and points out that 
the knowledge service digitization of ancient books is the inevitable trend in the future under three drives of academic 
inheritance ，user demand and the development of information technology. 
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